从名字上来看:人所创造出来的「智慧」,让机器展现「智慧」
人工智能是一个目标,它不是一个单一的技术
让机器产生复杂有结构的物件,如:
让 ChatGPT 写一篇 100 字的中文文章,标题为《缝隙的联想》
用中文字组成 100 字的文章有多少的可能性?
假设中文常用字为 1000 个,
可以说是:从近乎无穷的可能中找出适当的组合
分类(Classification):从有限的选项中做选择
![[Pasted image 20250727194659.png]]
机器学习 ≈ 机器自动从资料找一个函式
![[Pasted image 20250727194906.png]]
中学的时候你用人力算出参数,机器学习是自动算出参数的方法
机器学习所要面临的问题要比
有一个函式:猫 or 狗 = 𝑓(图片) = …a…b…c…d…e…f…g(上万个参数)
![[Pasted image 20250727201327.png]]
机器学习可以把上万个参数找出来:𝑎 = 1.3, 𝑏 = −7.2, 𝑐 = 0.4, ...
表示上万个参数 —— 类神经网络 (Neural Network):
![[Pasted image 20250727201928.png]]
深度学习是机器学习的一种。可以有很多方法表示有大量参数的函式,当用类神经网络表示时,就是深度学习
![[Pasted image 20250727202456.png]]
![[Pasted image 20250727202732.png]]
输出文本 = f(输入文本) = …a…b…c…d…e…f…g(上亿个参数)
上亿个参数的表示:Transformer(类神经网络的一种)
![[Pasted image 20250727203127.png]]
训练资料:
| 输入 | 输出 |
|---|---|
| 何谓人工智能? | 人工智能就是 …… |
| 说个跟人工智能有关的故事 | 很久很久以前 …… |
| 写一首诗 | 床前明月光 …… |
| 人工智能的英文翻译 | Artificial Intelligence (AI) |
机器学习把上亿个参数找出来
AI 画图:Stable Diffusion, Midjourney, DALL·E
输出图片 = f(输入文本) = …a…b…c…d…e…f…g(上亿个参数)
训练资料:
![[Pasted image 20250727203712.png]]
机器学习把上亿个参数找出来
也就是需要有「创造力」
输出文本 = f(输入文本) = …a…b…c…d…e…f…g(上亿个参数)
训练资料:
| 输入 | 输出 |
|---|---|
| 何谓人工智能? | 人工智能就是 …… |
| 说个跟人工智能有关的故事 | 很久很久以前 …… |
| 写一首诗 | 床前明月光 …… |
| 人工智能的英文翻译 | Artificial Intelligence (AI) |
测试时:… = 𝑓(写一篇题为需要创造 「缝隙的联想」的文章)
需要创造全新的文句
如何做到上述的「创造力」?
![[Pasted image 20250727210314.png]]
以上描述的拆解成一连串的文字接龙就是语言模型
每一步文字接龙是一个分类问题,整体上是一个生成式问题
关系图:
![[Pasted image 20250727210415.png]]
![[Pasted image 20250727210945.png]]
把复杂的物件拆解成较小的单位,之后依照某种固定顺序依序生成的策略,叫做 Autoregressive Generation
ChatGPT 就是采用此生成策略
李宏毅老师 2015 年的课程:《机器学习及其深层与结构化》
![[Pasted image 20250727211454.png]]
过去 2015 年讲的结构化学习和现在的生成式人工智能,背后的技术有什么一样的地方呢?
结论是没什么一样的地方
技术变化真的是非常的快,短短十年的时间,技术已经有了翻天覆地的变化。但是生成式人工智能的概念不是今天才有的
2006 年上线的 Google 翻译
![[Pasted image 20250727212150.png]]
翻译是生成式人工智能的一种应用
今日的生成式人工智慧有什么特别厉害的地方呢?能够突然爆火起来